1. Caracterizar los perfiles proteicos de bacterias desarrolladas en diferentes medios de cultivo (TSA.glucosa, TSA, Agar leche y Agar suero) por la técnica de MALDI-TOF-MS.
2. Identificar señales espectrales (picos) diferenciales entre las bacterias con diferentes grados de producción de biofilm.
3. Asignar dichos picos diferenciales con proteínas descriptas en bases de datos (búsqueda bio-informática).
Las colonias de bacterias se recolectaron con un palillo de madera estéril y se colocaron en el electrodo multi-well del equipo Microflex LT por cuatriplicado biológico y triplicado técnico. Se colocó 1 μl de Ácido fórmico (sigma) sobre las colonias y se dejó evaporar el líquido. Luego se colocó la matriz ácido alfa-ciano-4-hidroxicinámico (HCCA) y también se dejó evaporar. Una vez que la placa estuviera completamente seca se colocó en el equipo Microflex LT (software: flexControl 3.4.135.0, disparos de láser: 240, repetición de láser: 60, modo de ionización: LD+; rango: 2-20 kDa, método: MBT_FC.par). La intensidad del laser se seteo en 60% y se adquirieron los espectros en modo manual.
1) MALDI.ID
La determinación de las especies se hizo utilizando la base de datos de Biotyper versión 3.1.1 (BD, Bruker Daltonik GmbH, Bremen, Alemania). Los resultados arrojados por este software se interpretan del siguiente modo: sí el score es mayor a 2.0 el resultado es confiable a nivel de especie (Staphylococcus aureus), si el valor de score se ubica entre 1.7 - 2.0 el resultado es confiable a nivel de genero (Staphylococcus spp.) y, por último, si el valor de score es menor a 1.7 el resultado es no confiable.
La comparación estadística de frecuencias se realizó mediante la prueba Pearson’s Chi-squared con los p valores simulados por prueba de Monte Carlo. Posteriormente, se calcularon los residuos de Pearson, que miden el alejamiento de cada una de las frecuencias particulares al valor teórico de frecuencia homogénea. Las unidades de estos residuos están en desvíos estándar, con lo que residuos mayores a 2 (frecuencia diferencialmente elevada) o menores a -2 (frecuencia diferencialmente baja) representan un alejamiento de la independencia (homogeneidad de frecuencias) con un nivel de significación del 95%.
2) MALDI.R
a) Obtención de la matriz intensidades
El pre-procesamiento de los espectros se realizó mediante el software RStudio. Este esquema de trabajo finaliza con la obtención de una matriz de intensidades, en la cuál las columnas contienen los distintos picos (m/z), las filas los distintos sueros y las celdas los valores de intensidad. El algoritmo Binary Discriminant analysis (BDA) permite hacer una transformación binaria de las intensidades, se calcula el valor promedio de intensidad para cada columna (pico), luego si los valores puntuales superan ese valor medio se le asigna 1, caso contrario 0; a esta matriz se la denomina dicotomizada. Además se hizo una transformación binaria de las intensidades, si el valor de intensidad era mayor que 0 se asignó 1 y si era 0 se asignó 0.
b) Selección de picos diferenciales
Se realizó el análisis supervisado BDA. El objetivo fue buscar las señales espectrales (picos) que presentaran diferencias significativas entre los grupos.
c) Análisis no supervisados
En primera medida se seleccionó la matriz ( intensidad, dicotomizada y/o binaria) que mejor diferenciación generara mediante HeatMap. Posteriormente, se analizaron los perfiles de los espectros por medio del ensamble de los algoritmos Hierarchical k-means clustering- Principal component analysis (PCA) usando los mejores 5/10/15/20 picos que presentaron diferencias significativas por BDA.
d) Asignación bio-informática
Se utilizo las base de datos:Uniprot
En el medio con suero se observó una frecuencia diferencialmente elevada de valores de biofilm NF y DBF. Los medios TSB y TSB.g presentaron las frecuencias de niveles de biofilm NF más bajas. En resumen, el biofilm parece formarse en los medios TSA y TSA.g y el medio con suero parece disminuir los niveles de producción de biofilm.
Las variables medios y niveles de formación de biofilm resultaron dependientes (X-squared = 71.314, df = NA, p-value = 0.0004998). Esto significa que el resultado del nivel de la formación del biofilm depende del medio en el que se crezcan las cepas.
Las variables color en TSA y niveles de formación de biofilm resultaron independientes (X-squared = 6.379, df = NA, p-value = 0.09095).
Las cepas con niveles de biofilm FFB presentaron frecuencias elevedas de color amarillo. Los niveles MFB de color blanco.
Las variables color en TSAglc y niveles de formación de biofilm resultaron independientes (X-squared = 7.8635, df = NA, p-value = 0.05747).
Las cepas con niveles de biofilm FFB presentaron frecuencias elevedas de color amarillo. Los niveles MFB de color blanco.
Las variables color en TSA 24 hs y niveles de formación de biofilm resultaron independientes (X-squared = 10.495, df = NA, p-value = 0.1014).
Las cepas con niveles de biofilm FFB se presentaron diferencialmente asociadas con colores amarillos. Los niveles MFB con cepas color blanco.
Las cepas con niveles de biofilm FFB presentaron frecuencias elevadas pero no significativas con colonias negras rugosas.
Las variables color rojo congo y niveles de formación de biofilm resultaron independientes (X-squared = 6.3815, df = NA, p-value = 0.4148).
El gráfico de barras muestra la interpretación de los scores de las determinaciones de MALDI-TOF-MS. El gráfico está dividido en 4 bloques, uno para cada medio. En el eje-x se muestran las distintas cepas y el eje-y representa el porcentaje de especies detectado para cada cepa en los distintos medios. Las distintas especies están representadas por un código de colores.
Puede oberservarse como la frecuencia de especies detectada en los distintos medios es diferente. Particularmente, en el medio TSA se detectaron las cepas siempre como Staphylococcus aureus, mientras que en el medio Suero de leche, se detectaron más frecuentemente como Lactobacillus.
Las variables especies y medios resultaron dependientes (X-squared = 125.86, df = NA, p-value = 0.0004998). Esto significa que el resultado de la identificación por MALDI-TOF-MS depende del medio en el que se crezcan las cepas.
El gráfico muestra que las cepas crecidas en medio TSA mostraron valores de frecuencia diferencialmente elevados en su identificación como Staphylococcus aureus. Mientras que las cepas crecidas en medio suero de leche mostraron valores de frecuencia diferencialmente disminuidos en su identificación como Staphylococcus aureus.
Por otro lado, las cepas crecidad en medio TSA.glc mostraron valores de frecuencia diferencialmente elevados en su identificación como Staphylococcus sp.
Las cepas crecidad en medio suero de leche mostraron valores de frecuencia diferencialmente elevados en su identificación como mezcla de Lactobacillus sp./Staphylococcus sp., Lactobacillus sp y Lactobacillus sakei.
Por último, las cepas crecidad en medio de leche, mostraron la mayor frecuencia de identificaciones no confiables.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 66.9% de la variación total de los datos.
Se puede observar la separación de la cepa RA22 del resto de las cepas. Las cepas RA18 y MB308 no se pudieron distinguir como clusters individuales.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 61.6% de la variación total de los datos.
Se puede observar la separación de la cepa RA22 y RF122 del resto de las cepas. Las cepas RA18 y MB308 no se pudieron distinguir como clusters individuales.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 88.1% de la variación total de los datos.
Se puede observar la separación de las cepas RA22, MBb30 y V329 del resto de las cepas. Las cepas MB308, MBT002, MB019, RA18, MB326 forman un cluster único.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 62.2% de la variación total de los datos.
Se puede observar la separación en clusters individuales de todas las cepas.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.
Se observa la separación en sólo 2 clusters de los 4 grupos. La cepa en TSB y TSB g son indistinguibles, así como en Ag.suero y Ag.leche.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 90.8% de la variación total de los datos.
Se observa la separación en 4 clusters de los 4 grupos. La cepas son diferenciables en los cuatro medios.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.
Se observa la separación en 4 clusters de los 4 grupos. La cepas son diferenciables en los cuatro medios.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.
Se observa la separación en sólo 2 clusters de los 4 grupos. La cepa en TSB y TSB g son indistinguibles, así como en Ag.suero y Ag.leche.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 91% de la variación total de los datos.
Se observa la separación en 4 clusters de los 4 grupos. La cepas son diferenciables en los cuatro medios.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.
Se observa la separación en 4 clusters de los 4 grupos. La cepas son diferenciables en los cuatro medios.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.
Se observa la separación en sólo 2 clusters de los 4 grupos. La cepa en TSB y TSB g son indistinguibles, así como en Ag.suero y Ag.leche.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.
Se observa la separación en sólo 2 clusters de los 4 grupos. La cepa en TSB y TSB g son indistinguibles, así como en Ag.suero y Ag.leche.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.
Se observa la separación en 4 clusters de los 4 grupos. La cepas son diferenciables en los cuatro medios.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.
Se observa la separación en 4 clusters de los 4 grupos. La cepas son diferenciables en los cuatro medios.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 75.8% de la variación total de los datos.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 94.1% de la variación total de los datos.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 61.9% de la variación total de los datos.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 66% de la variación total de los datos.
Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.
El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 38% de la variación total de los datos.